جانهی داده های گمشده در آمارگیری های پانلی با استفاده از الگوریتم em

thesis
abstract

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در انواع آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معمولاً با کاهش پاسخگو در دوره های دوم به بعد تولید داده ها مواجه هستند. این امر که منجر به نمونه ی کاهیده می شود سبب کاهش کارایی براوردگرها و غالباً نیز سبب اریبی آن ها می شود. برای برخورد با این مشکل در آمارگیری پانلی روش های ‎«جانهی»‎ و ‎«وزن دهی»‎ گوناگونی وجود دارد که از جمله ی این روش های جانهی، جانهی با الگوریتم ‎em‎ می باشد. الگوریتم ‎em‎ یک الگوریتم مکرر برای براورد ماکسیمم درستنمایی مسئله ی داده های گمشده یا ناتمام می باشد. با توجه به این که ساختار گمشدگی تصادفی فرض شده است لذا این الگوریتم برای جانهی مناسب می باشد. در این پایان نامه پس از معرفی مفهوم های اولیه آمارگیری پانلی، انواع گمشدگی در آمارگیری های پانلی و ساختارهای گمشدگی، الگوریتم ‎em‎ به عنوان روشی برای جانهی داده های گمشده معرفی می شود و به دلیل مشکلاتی که در محاسبات این الگوریتم ممکن است وجود داشته باشد چهار نوع از این الگوریتم معرفی می شود. سرانجام با استفاده از داده های آمارگیری پانلی خانواری انگلیس، توزیع نمونه گیری شبیه سازی شده و روش جانهی با الگوریتم ‎em‎ با دو روش جانهی با میانگین مشاهده های مشابه و جانهی با نمونه ی جدید از نظر معیارهای مختلف (با توجه به اثر اندازه ی نمونه، همبستگی بین دوره ها و نرخ بی پاسخی دوره) مقایسه می شوند. نتایج این مطالعه نشان می دهد که جانهی متغیر تحت بررسی در آمارگیری پانلی خانواری انگلیس با استفاده از الگوریتم ‎em‎ وقتی که همبستگی بین دو دوره زیاد باشد، عملکرد بهتری دارد.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

مقایسه ی جانهی الگوریتم em با دو روش جانهی میانگینی و نمونه های جدید در آمارگیری های پانلی

در اقتصاد و سایر علوم اجتماعی، پژوهش گران اغلب تمایل به مدل بندی داده های پانلی که در آن واحدهای نمونه ای به طور مکرر در مقاطع زمانی مختلف مشاهده می شوند، دارند. یکی از کاربردهای داده های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری ها به ویژه آمارگیری های پانلی، بی پاسخی یک مشکل اساسی است که در داده های علوم اجتماعی و پزشکی به وفور رخ می دهد. این نوع مطالعه ها معم...

full text

مقایسه‌ی جانهی الگوریتم EM با دو روش جانهی میانگینی و نمونه‌های جدید در آمارگیری‌های پانلی

 در اقتصاد و سایر علوم اجتماعی، پژوهش‌گران اغلب تمایل به مدل‌بندی داده‌های پانلی که در آن واحدهای نمونه‌ای به‌‌طور مکرر در مقاطع زمانی مختلف مشاهده می‌شوند، دارند. یکی از کاربردهای داده‌های پانلی براورد نرخ تغییر میانگین متغیر پاسخ در طی زمان است. در تمام آمارگیری‌ها به ویژه آمارگیری‌های پانلی، بی‌پاسخی یک مشکل اساسی است که در داده‌های علوم اجتماعی و پزشکی به وفور رخ می‌دهد. این نوع مطالعه‌ها م...

full text

مقایسه روش الگوریتم em و روش های متداول جانهی داده های گمشده: مطالعه روی پرسشنامه خوددرمانی بیماران دیابتی

مقدمه و اهداف: داده های گمشده، چالش بزرگی در پژوهش ها به شمار می آیند. به فراخور نوع مطالعه و نوع متغیرهای مورد بررسی، روش های گوناگونی برای کار با این داده ها تا کنون معرفی شده است. هدف این مطالعه مقایسه پنج روش جانهی متداول در برخورد با گمشدگی در داده های پرسشنامه ای بود. روش کار: در این مطالعه تعداد500 پرسشنامه مربوط به خوددرمانی در بیماران دیابتی مورد استفاده قرار گرفت. گمشدگی در مشاهده ها ...

full text

مقایسه روش الگوریتم EM و روش‌های متداول جانهی داده‌های گمشده: مطالعه‌روی پرسشنامه خوددرمانی بیماران دیابتی

Background and Objectives: Missing data is a big challenge in the research. According to the type of the study and of the variables, different ways have been proposed to work with these data. This study compared five popular imputation approaches in addressing missing data in the questionnaires. Methods: In this study, 500 questionnaires were used for self-medication in diabetic patients. Mi...

full text

تاثیر داده های گمشده در نمودارهای رشد

سابقه و هدف: استفاده از منحنی رشد قدرتمندترین وسیله پایش رشد کودکان می باشد و از این طریق می توان انحرافات از الگوی رشد طبیعی را بموقع تشخیص داد. ریزش داده ها و مقادیر گمشده از مشکلات معمولی در تجزیه و تحلیل داده های طولی رشد محسوب می شود. لذا اهمیت دارد که با برآورد نمودن مقادیر گمشده، داده ها کامل شده و در مسیری مناسب و صحیح جهت تحلیل قرار داده شوند. مواد و روش ها: این مطالعه طولی طی دو سال ب...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه علامه طباطبایی - دانشکده اقتصاد

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023